统一框架下的具身多模态推理:自变量机器人让AI放下海德格尔的锤子
统一框架下的具身多模态推理:自变量机器人让AI放下海德格尔的锤子当 AI 放下海德格尔的锤子时,意味着机器人已经能够熟练使用工具,工具会“隐退”成为本体的延伸,而不再是需要刻意思考的对象。
当 AI 放下海德格尔的锤子时,意味着机器人已经能够熟练使用工具,工具会“隐退”成为本体的延伸,而不再是需要刻意思考的对象。
好饭不怕晚,MiniMax 终于把这款金字塔尖的推理模型拿出来了。
AI Coding 或者 Coding Agent,或许是当下最火热的 AI 赛道。这是模型能力的主线,更强的代码能力,意味着模型能够解锁更多应用场景。
近期,人工智能领域对“具身智能”的讨论持续升温——如何让AI不仅能“理解”语言,还能用“手”去感知世界、操作环境、完成任务?相比语言模型的迅猛发展,真正通向Agent的下一步,需要AI具备跨模态感知、动作控制与现实泛化能力。具身智能让AI不仅能“思考”,更能“感知”“行动”。
编程智能体确实厉害!Transformer作者Llion Jones初创公司,专门收集了NP难题并测试了AI智能体,结果竟在上千人竞赛中排第 21!这意味着,它已经比绝大多数人写得好了。
6 月 17 日消息,尽管谷歌拥有庞大的云计算业务和大量人才,但在生成式人工智能竞赛中常常被视为处于劣势的一方。
由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收!这是该领域首个全面系统的综述,为语音 AI 的未来发展指明了方向。
如果你也在用 Cursor 或者类似的 AI 编程神器,我敢打赌,你每个月的 AI 调用次数(Request)至少浪费了90%!
AI 角色扮演、AI 情感陪伴……更多 AI 交互方式的出现正在重新定义“社交”。
过去一段时间,“通用 Agent”成了 AI 应用的默认发展方向。无论产品叙事还是技术布局,大家似乎都在追求一个“什么都能做”的智能体。但现实逐渐显露:通用 Agent 在真实世界中并不那么“通用”。